iT邦幫忙

2025 iThome 鐵人賽

DAY 3
0

標題好像暴露了一些奇怪的東西,但是我們先不要在意那些小細節
咳咳總之今天我要來介紹的就是LLM是甚麼東東


LLM 的全名是 Large Language Model, 也就是大型語言模型
把每一個單字拆解開來就是
Large:代表它是用超大規模的參數(可能有到數十億到上千億)與龐大的資料集訓練出來的。
Language:它專門處理語言資料像是文字、程式碼之類的。
Model:是一個數學模型,用來模擬語言規律。
簡單來說LLM 是一種「透過大量文字學會語言規律的統計模型」。


所以LLM是怎麼生成內容的?
LLM會根據前面的內容,來預測下一個最有可能出現的字或詞
像是我們在手機上打「今天的天氣很…」,手機一般的補字系統可能會出現「好」、「讚」、「爛」、「爽」之類的幾個選項。
而LLM則會根據他的訓練資料跟上下文來判斷「好」出現的機率50%、「讚」30%、「爛」15%、「爽」4%,然後選擇一個最合理的選項後,繼續往下計算。
推算的過程會一個字一個字的計算下去,直到完整的的句子完成為止。


跟手機補字系統的差別
看到上面的用途,有些人就會覺得說啊不是跟手機上的推薦選項差不多,他們差別在哪裡?
手機補字系統通常只會看我們上一個打的字或詞,然後來給我們建議的詞彙,用途基本上就是讓我們輸入的速度變快一點而已。
而LLM看到的上下文可以到上千字,所以LLM除了可以在文章上幫我們補字以外,還可以直接寫一個完整的文章、翻譯、回大問題、推理等,應用的場景比較多。


上一篇
Day 02 . 生成式 AI是啥?與傳統 AI 的差異
系列文
30天從不認識生成式AI到好像稍微可能有點熟悉的過程3
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言